Model Selection

Multi-dataset fine-tuning

# Multi-dataset fine-tuning

Whisper Large V3 Vaani Hindi

A Hindi speech recognition model fine-tuned based on OpenAI's Whisper-Large-V3, trained on approximately 718 hours of transcribed Hindi speech data

Speech Recognition

Vi Whisper Large V3 Turbo V1

Whisper-V3-Turbo model optimized for Vietnamese automatic speech recognition (ASR) tasks, fine-tuned using multiple Vietnamese datasets

Speech Recognition

Transformers Other

XLSR WithLM Malayalam

This model is a fine-tuned version of facebook/wav2vec2-xls-r-300m on the IMaSC, Indic TTS Malayalam, and OpenSLR Malayalam training datasets, supporting automatic speech recognition for Malayalam.

Speech Recognition

A Hindi text-to-speech model fine-tuned from a forked version of Coqui TTS, supporting Hindi and English speech synthesis with Hindi accent

Speech Synthesis

Transformers Supports Multiple Languages

Vit Facial Expression Recognition

A ViT-based facial expression recognition model fine-tuned on FER2013, MMI, and AffectNet datasets, capable of recognizing seven basic emotions

Vit Facial Expression Recognition

ViT-based facial expression recognition model, fine-tuned on FER2013, MMI, and AffectNet datasets, supporting seven emotion classifications

Kobart Summary V3

Korean text summarization model fine-tuned based on kobart, generating summaries with more short sentences

Text Generation

Transformers Korean

Matter 0.1 7B GGUF

Matter 7B is a fine-tuned model based on Mistral 7B, designed for text generation tasks, supporting conversational interaction and function calling.

Large Language Model English

Marian Finetuned Multidataset Kin To En

This model is a fine-tuned machine translation model for Kinyarwanda to English, based on Helsinki-NLP/opus-mt-rw-en

Machine Translation

Wav2vec2 Large Xlsr 53 Japanese

Japanese speech recognition model fine-tuned from facebook/wav2vec2-large-xlsr-53, supporting 16kHz sampled audio input

Speech Recognition

Transformers Japanese

Whisper Small Khmer V2

A Khmer speech recognition model fine-tuned based on OpenAI Whisper-small, trained on OpenSLR, Google FLEURS, and km-speech-corpus datasets

Speech Recognition Other

Flan T5 3b Summarizer

A general-purpose summarizer based on the 3B-parameter google/flan-t5-xl model fine-tuned on multiple summarization datasets, suitable for academic and general scenarios.

Text Generation

Transformers English

Whisper Telugu Medium

Telugu speech recognition model fine-tuned based on OpenAI Whisper-medium, trained on multiple public Telugu ASR datasets

Speech Recognition Other

Whisper Large V2 Mix Jp

An automatic speech recognition (ASR) model fine-tuned on Japanese speech datasets based on OpenAI Whisper-large-v2

Speech Recognition

Whisper Medium Da

A Danish automatic speech recognition (ASR) model fine-tuned based on OpenAI Whisper Medium, trained on Common Voice 11 and FLEURS datasets

Speech Recognition

Transformers Other

Whisper Th Medium Combined

Fine-tuned on an enhanced Thai dataset based on openai/whisper-medium for Thai automatic speech recognition

Speech Recognition

Whisper Large V2 Pl V2

An automatic speech recognition model fine-tuned on Polish datasets based on Whisper Large v2, supporting Polish speech-to-text tasks.

Speech Recognition

Transformers Other

Whisper Medium Id

A speech recognition model fine-tuned on Indonesian datasets based on openai/whisper-medium, significantly improving the accuracy of Indonesian recognition.

Speech Recognition

Transformers Other

Legal BERTimbau Sts Large Ma V3

Portuguese legal domain sentence similarity model based on BERTimbau large model, supporting 1024-dimensional vector representation

Transformers Other

Ptt5 Base Summ Xlsum

A Brazilian Portuguese abstractive text summarization model fine-tuned on PTT5, supporting summarization for various text types including news.

Text Generation

Transformers Other

Deberta Base Combined Squad1 Aqa And Newsqa

A Q&A model based on DeBERTa-base architecture, jointly fine-tuned on SQuAD1, AQA, and NewsQA datasets

Question Answering System

Wav2vec2 Xls R 1b Italian Doc4lm 5gram

Italian speech recognition model fine-tuned from XLS-R 1B parameter model, supports recognition with language model

Speech Recognition

Transformers Other

radiogroup-crits

Wav2vec2 Large Xlsr 53 Finnish

A Finnish automatic speech recognition model fine-tuned from facebook/wav2vec2-large-xlsr-53, supporting 16kHz sampled audio input.

Speech Recognition Other

Wav2vec2 Large Xlsr 53 Greek

This is a Greek automatic speech recognition model based on the XLSR-Wav2Vec2 architecture, developed by the Hellenic Military Academy and the Technical University of Crete.

Speech Recognition Other

Mbart Large Cc25 Cnn Dailymail Xsum Nl

A Dutch news summarization model fine-tuned on mbart-large-cc25, supporting CNN/DailyMail and XSum format summarization tasks

Text Generation

Transformers Other

Wav2vec2 Large Xlsr Hindi

Hindi speech recognition model fine-tuned from facebook/wav2vec2-large-xlsr-53, supporting 16kHz sampled audio input

Speech Recognition

Transformers Other

Rut5 Base Absum

This is a Russian abstractive summarization model based on the T5 architecture and fine-tuned on multiple datasets, capable of generating concise and accurate text summaries.

Text Generation

Transformers Other

Wav2vec2 Base Vn 270h

A speech recognition model fine-tuned with approximately 270 hours of Vietnamese annotated data, supporting Vietnamese automatic speech recognition tasks

Speech Recognition Other

Wav2vec2 Large Xlsr 53 Finnish

A Finnish automatic speech recognition model fine-tuned from facebook/wav2vec2-large-xlsr-53, supporting 16kHz sampled audio input

Speech Recognition

Transformers Other

Wav2vec2 Large Xlsr Malayalam

A Malayalam fine-tuned speech recognition model based on facebook/wav2vec2-large-xlsr-53, supporting 16kHz sampled audio input.

Speech Recognition Other

Camembert Base Squadfr Fquad Piaf

A French Q&A model based on CamemBERT, fine-tuned on three French Q&A datasets: PIAF, FQuAD, and SQuAD-FR

Question Answering System

Transformers French

Wav2vec2 Large Xlsr 53 Finnish

This is an automatic speech recognition model fine-tuned on Finnish based on facebook/wav2vec2-large-xlsr-53, but has been marked as an old model, and it is recommended to use newer alternatives.

Speech Recognition Other

Dpr Question Encoder Fr Qa Camembert

A French DPR model based on CamemBERT, optimized for French Q&A tasks, fine-tuned on PIAF, FQuAD, and SQuAD-FR datasets

Question Answering System

Transformers French

Xlsr 53 Wav2vec Greek

This is a Greek fine-tuned speech recognition model based on facebook/wav2vec2-large-xlsr-53, using the Common Voice and CSS10 Greek datasets.

Speech Recognition

Transformers Other

Wav2vec2 Large 100k Voxpopuli Catala

A Catalan speech recognition model fine-tuned based on the VoxPopuli large model, trained on Common Voice and ParlamentParla datasets

Speech Recognition Other

Wav2vec2 Large Xlsr Vietnamese

This is a Vietnamese fine-tuned speech recognition model based on facebook/wav2vec2-large-xlsr-53, trained using the Common Voice and Infore_25h datasets.

Speech Recognition Other

Wav2vec2 Large Xlsr 53 Greek

This is a Greek fine-tuned speech recognition model based on facebook/wav2vec2-large-xlsr-53, trained using the Common Voice and CSS10 datasets.

Speech Recognition Other

Wav2vec2 Xls R 1b Ca Lm

This is a Catalan speech recognition model fine-tuned from facebook/wav2vec2-xls-r-300m, trained on multiple Catalan datasets.

Speech Recognition

Transformers Other

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Russian

A Russian speech recognition model fine-tuned on Facebook's Wav2vec2 Large 100k Voxpopuli model using Common Voice 7.0, M-AILABS datasets, and data augmentation techniques.

Speech Recognition

Transformers Other

Wav2vec2 Base Voxpopuli Sv Swedish

A Swedish speech recognition model fine-tuned using NST and Common Voice data, based on Facebook's VoxPopuli-sv base model.

Speech Recognition

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase